import xlrd
from Bai_Du import *


wb = xlrd.open_workbook(filename="百度合作单位-人员管理-二期.xls",encoding_override=True)
sb = wb.sheet_by_index(0)
nrows = sb.nrows
ncols = sb.ncols

# a)统计所有表格中有多少人
print("表格里一共有{}人".format(nrows-1))

# b)统计办电信，联通，移动的用户数量（14,17开头为电信）（13开头为移动）（15开头为联通）
dx = []
yd = []
lt = []
for i in range(sb.ncols):
    if sb.col_values(i)[0] == "电话号码":
        for j in sb.col_values(i)[1:]:
            if 13000000000 < int(j) < 14000000000:
                yd.append(j)
            elif 15000000000 < int(j) < 16000000000:
                lt.append(j)
            elif 14000000000 < int(j) < 15000000000 or 17000000000 < int(j) < 18000000000:
                dx.append(j)
print("电信用户为{}个".format(len(dx)))
print("移动用户为{}个".format(len(yd)))
print("联通用户为{}个".format(len(lt)))

# c)总公司男女人数
for i in range(sb.ncols):
    if sb.col_values(i)[0] == "性别":
        for j in sb.col_values(i)[1:3]:
            if j == "男":
                print("男性人数为{}".format(sb.col_values(i)[1:].count(j)))
            elif j == "女":
                print("女性人数为{}".format(sb.col_values(i)[1:].count(j)))

# d)年龄超过45岁的老员工人数
age = []
for i in range(sb.ncols):
    if sb.col_values(i)[0] == "年龄":
        for j in sb.col_values(i)[1:]:
            if j > 45:
                age.append(j)
print("年龄超过45岁的老员工有{}个".format(len(age)))

# e)薪资高于8000元的高薪人员数量和薪资低于3000的底薪人员数量
ei = []
th = []
for i in range(sb.ncols):
    if sb.col_values(i)[0] == "薪资":
        for j in sb.col_values(i)[1:]:
            if j > 8000:
                ei.append(j)
            elif j < 3000:
                th.append(j)
print("薪资高于8000元的高薪人员数量为{}人".format(len(ei)))
print("薪资低于3000元的高薪人员数量为{}人".format(len(th)))

# f)统计去传媒公司的工作的人员数量
media = []
for i in range(sb.ncols):
    if sb.col_values(i)[0] == "外包公司":
        for j in sb.col_values(i)[1:]:
            if len(j.split("传媒")) == 2:
                media.append(j)
print("去传媒公司的工作的人员数量为{}人".format(len(media)))
# g)统计一下可能在疫情高危地区的人数（高危地区：黑龙江，北京，福建，四川）
HeiLongJiang = []
BeiJing = []
FuJian = []
SiChuan = []
for i in range(sb.ncols):
    if sb.col_values(i)[0] == "居住地址":
        for j in sb.col_values(i)[1:]:
            if len(j.split("黑龙江")) == 2:
                HeiLongJiang.append(j)
            elif len(j.split("北京")) == 2:
                BeiJing.append(j)
            elif len(j.split("福建")) == 2:
                FuJian.append(j)
            elif len(j.split("四川")) == 2:
                SiChuan.append(j)
print("可能在疫情高危地区的人数为%s人，其中包括黑龙江%s人，北京%s人，福建%s人，四川%s人。"%(len(HeiLongJiang)+len(BeiJing)+len(FuJian)+len(SiChuan),len(HeiLongJiang),len(BeiJing),len(FuJian),len(SiChuan)))



# 将表格数据都存入到集团数据库中
# zong = []
# for x in range(1,nrows):
#     xiao = []
#     for y in range(ncols):
#         xiao.append(sb.cell_value(x,y))
#         if y == 13:
#             zong.append(tuple(xiao))
# for i in zong:
#     sql = "insert into t_baidu value (%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"
#     param = i
#     insert(sql,param)



